當模型在生成文字時,每一步都會面臨很多可能的選項,而最終輸出的過程,就叫做解碼(decoding)。
Decoding 的核心問題就是從眾多可能的輸出當中選擇最佳的文字序列。
Beam Search 是序列生成中最常用的演算法之一,它被廣泛應用在翻譯、語音與文本生成任務中。
今天就要來介紹 Beam Search Algorithm~
在解碼(decoding)的階段,常見的方法有:
以下為運作方式:
總結來說,Beam Search Algorithm 在效率與品質之間取得平衡,比 Greedy search 更可靠,也比窮舉法更有可行性,在翻譯、語音辨識與文本生成等需要產出完整序列的任務當中,Beam Search 都是常用的方法之一。